Average sentence length | # of sentences | Source |
---|---|---|
78.33 | 12 | http://fa.wikipedia.org/wiki/علی_کریمی |
83.30 | 10 | http://fa.wikipedia.org/wiki/امپراتوری_مائوریا |
90.00 | 11 | http://fa.wikipedia.org/wiki/مهبانگ |
94.70 | 10 | http://fa.wikipedia.org/wiki/حرم_امام_رضا |
99.00 | 11 | http://fa.wikipedia.org/wiki/فرایند_پشتیبانی |
99.25 | 12 | http://fa.wikipedia.org/wiki/تریلر_(آلبوم) |
104.13 | 16 | http://fa.wikipedia.org/wiki/فهرست_واپسین_گفتهها |
104.70 | 10 | http://fa.wikipedia.org/wiki/جامعه_ملل |
105.40 | 10 | http://fa.wikipedia.org/wiki/فهرست_دیوها_در_آرس_گویتیا |
106.82 | 11 | http://fa.wikipedia.org/wiki/لست._افام |
106.94 | 17 | http://fa.wikipedia.org/wiki/معنی_نام_کشورها |
107.50 | 14 | http://fa.wikipedia.org/wiki/ارومیه |
108.50 | 12 | http://fa.wikipedia.org/wiki/سپتیموس_هیپ |
111.38 | 16 | http://fa.wikipedia.org/wiki/ونکوور |
112.09 | 11 | http://fa.wikipedia.org/wiki/عراق |
112.88 | 17 | http://fa.wikipedia.org/wiki/آدولف_هیتلر |
113.82 | 11 | http://fa.wikipedia.org/wiki/سیاهچاله |
116.00 | 14 | http://fa.wikipedia.org/wiki/ماهی |
117.60 | 10 | http://fa.wikipedia.org/wiki/خلافت_راشدین |
118.23 | 13 | http://fa.wikipedia.org/wiki/اخترشناسی |
118.70 | 10 | http://fa.wikipedia.org/wiki/منظومه_شمسی |
118.70 | 10 | http://fa.wikipedia.org/wiki/دونالد_ترامپ |
118.93 | 14 | http://fa.wikipedia.org/wiki/لباس_محلی_اقوام_ایرانی_بر_پایه_استانها |
121.55 | 11 | http://fa.wikipedia.org/wiki/نلسون_ماندلا |
121.91 | 11 | http://fa.wikipedia.org/wiki/لشکرکشیهای_روسها_به_کناره_دریای_خزر |
122.40 | 10 | http://fa.wikipedia.org/wiki/باشگاه_فوتبال_اینتر_میلان |
123.29 | 14 | http://fa.wikipedia.org/wiki/آدم |
123.62 | 13 | http://fa.wikipedia.org/wiki/موبی_دیک |
123.69 | 13 | http://fa.wikipedia.org/wiki/رضاشاه |
123.84 | 19 | http://fa.wikipedia.org/wiki/آقامحمدخان_قاجار |
Average sentence length | # of sentences | Source |
---|---|---|
286.25 | 12 | http://fa.wikipedia.org/wiki/روانشناسی_فرگشتی |
281.85 | 13 | http://fa.wikipedia.org/wiki/روزشمار_ریاستجمهوری_حسن_روحانی_(۱۳۹۴) |
267.80 | 10 | http://fa.wikipedia.org/wiki/کیاییان |
266.00 | 12 | http://fa.wikipedia.org/wiki/جینی_(بچه_وحشی) |
265.42 | 12 | http://fa.wikipedia.org/wiki/اخلاق_کانتی |
255.93 | 14 | http://fa.wikipedia.org/wiki/کتابخانه،_موزه_و_مرکز_اسناد_مجلس_شورای_اسلامی |
248.00 | 23 | http://fa.wikipedia.org/wiki/جمهوری_وایمار |
245.30 | 10 | http://fa.wikipedia.org/wiki/امنیت_اطلاعات |
242.30 | 10 | http://fa.wikipedia.org/wiki/آزمایش_الک |
240.54 | 13 | http://fa.wikipedia.org/wiki/شاپور_بختیار |
239.30 | 10 | http://fa.wikipedia.org/wiki/علم_باز |
235.90 | 10 | http://fa.wikipedia.org/wiki/نبرد_کورسک |
235.46 | 13 | http://fa.wikipedia.org/wiki/بحران_اقتصادی_ایران_۱۴۰۰-۱۳۹۷ |
234.27 | 11 | http://fa.wikipedia.org/wiki/قرآن |
233.18 | 11 | http://fa.wikipedia.org/wiki/بازسازی_دیانای |
233.00 | 17 | http://fa.wikipedia.org/wiki/شورشهای_۲۰۰۲_گجرات |
232.50 | 14 | http://fa.wikipedia.org/wiki/حمله_نظامی_ترکیه_به_شمال_شرقی_سوریه_(۲۰۱۹) |
231.25 | 12 | http://fa.wikipedia.org/wiki/چاقی |
231.10 | 10 | http://fa.wikipedia.org/wiki/لاکپشت_پوزهعقابی |
230.64 | 11 | http://fa.wikipedia.org/wiki/رژیم_غذایی_کتوژنیک |
229.64 | 11 | http://fa.wikipedia.org/wiki/غرق_شدن_کشتی_تایتانیک |
229.09 | 11 | http://fa.wikipedia.org/wiki/بازار_آب |
228.65 | 17 | http://fa.wikipedia.org/wiki/علی_بن_موسی_الرضا |
228.50 | 14 | http://fa.wikipedia.org/wiki/نرمافزار_ضدویروس |
227.60 | 10 | http://fa.wikipedia.org/wiki/مدیریت_منازعه |
227.45 | 11 | http://fa.wikipedia.org/wiki/اعتراضات_دی_۱۳۹۶_ایران |
227.27 | 11 | http://fa.wikipedia.org/wiki/یکسانسازی_فرهنگی_در_ایران_معاصر |
225.18 | 11 | http://fa.wikipedia.org/wiki/مسئله_شر |
224.75 | 12 | http://fa.wikipedia.org/wiki/سید_علی_خامنهای |
224.67 | 12 | http://fa.wikipedia.org/wiki/قیام_ورشو |
The following subsections compare different text parameters for the different sources. First we looh for the sources having minimal and maximal average sentence length, respectively. To get reliable averages, we only use sources containing at least 10 sentences.
Average sentence length varies with text genre. In the case of newspaper corpora, we see big differences between yellow press and technical journals.
First table:
select round(avg(length(sentence)),2) as le, count(sentence) as cnt, source from sentences s, inv_so i, sources so where s.s_id=i.s_id and i.so_id=so.so_id group by source having cnt>=10 order by le limit 30;